查看原文
其他

行业洞察|张霄军:伦理视角下,机器翻译的能与不能

The following article is from 舜禹环球通Transphere Author 张霄军

思想是一切的答案,

我们是奔赴未知的探索者。


🖊

译界前沿/第三期

不惮细碎、踮起脚尖、贤者云集——舜禹有幸邀请到了业内不同身份的人物,将他们的思考付诸文字。


希望这里能够成为连接语言人的一方仰望星空之地,立足前沿并保持深度,包容并蓄且去伪存真。我们在此驻足,聆听君子之声,擦拭初心,而后整顿前行。


往期链接:

韩林涛:译员可以在人机共融时代有更好的发展

韩林涛:如何写出既符合学术规范又满足企业所需的MTI论文

曹首光:从译员到开发者,我对机器翻译的几点思考

张霄军博士

计算语言学家、机器翻译专家


现任西交利物浦大学翻译系教师、博士生导师,英国利物浦大学荣誉讲师,兼任国际计算语言学学会职业伦理委员会委员、世界翻译教育联盟翻译技术教育研究会副会长。曾任英国斯特林大学翻译课程主管(2016-2018)、爱尔兰都柏林城市大学机器翻译博士后研究员(2013-2016)、英国曼彻斯特大学访问学者(2010-2011)等。


机器翻译和人工翻译两个领域的融合日趋频繁,机器翻译技术目前正处在一个量变到质变的积累时期。这也将为我们带来更多思考:技术角度之外,机器翻译在工程伦理方面是否存在着不可逾越的鸿沟?机器翻译能否取代人工翻译?机器翻译服务提供商在提供便利的同时应该承担起什么责任?

对此,来自西交利物浦大学人文社科学院翻译系的张霄军博士在其2021年发表在《外国语文》上的“构建可信赖机器翻译系统的基本原则——一种基于工程伦理的观点”一文中表示,当前探讨未来社会二选一的问题为时尚早,我们“应该尽快厘清的是机器翻译的工程伦理问题”。这是因为“讨论人工翻译能不能被机器所取代的基础是机器翻译的工程伦理,如果没有厘清机器翻译的技术和工程伦理的框架,任何与之相关的断言都是不可信的”。
 
所谓工程伦理问题,即机器翻译系统设计研发过程中所涉及的有关人类安全、人类隐私保护与系统安全性能的问题,这包括:制度化建设问题、工程师责任和义务问题、及工程活动与社会政策问题。

机器翻译研发作为一项职业,什么样的职业行为才是社会所期待和信赖的呢?基于谷歌公司和欧盟委员会发布的工程伦理准则,张博士在文中提出了构建可信赖机器翻译系统的七个原则:人本性、鲁棒性、私密性、可解释性、公平性、可复现性、及可持续性。

张博士认为,人工翻译与机器翻译是互惠互助的关系而不是一方压倒性垄断。人工智能系统应该通过支持人的能动性和基本权利以实现公平社会而不是减少或限制人类自治。从这个角度出发,机器翻译的发展也不应脱离人类直接独立地实现语码自由转换。

技术鲁棒性要求算法足够安全、可靠和稳健,以克服人工智能系统所有生命周期阶段的错误或者不一致。在机器翻译的应用领域中,翻译系统一旦出现漏洞或被黑客攻击,其不准确的译文就可能会对人类生命安全带来影响。因此鲁棒性原则要求机器翻译应该通过人工译员的监管来评估、缓解和纠正潜在风险。

除了人机协同的方式,机器翻译系统本身的完善性也需加以保障,对数据集进行测试和处理的环节必不可少。他认为:“系统必须确保隐私和用户数据保护,同时,由特定机器翻译系统开发收集的数据中如若含有偏见及错误信息需要进行脱敏处理。”

“保护用户安全的同时也要做到数据完整可追溯,这就确保在译文产生争议时,机器翻译系统对翻译决策过程可以给出合理解释。” 可解释性就是要解释机器翻译系统的技术过程和相关的决策过程,技术可解释性则要求机器翻译所产生的译文是可以被人们所理解的。

关于机器翻译的“公平性”原则,张博士解释说,“在垂直领域,机器翻译系统可能是以用户为中心的,以一种允许所有人都平等地使用机器翻译产品和服务的方式,即无论年龄、性别、能力和其他特征,因此针对残障人士的辅助功能就显得格外重要,特别是在口语机器翻译系统研发中”。

“人机协同也要求相关专家能够准确表述系统行为和公开研发方法,方便其他研发者进行验证和再次实现。为了防止意外情况的发生,机器翻译系统必须是可复现且可靠的。”张博士说。国际通行的同行评审就包括对研究算法、数据和设计过程的评估,也包括对研究实验结果的复现。

最后张博士在文中指出,良好的机器翻译系统是兼具公平性与可持续性的。“人工智能系统研发中不仅应考虑人类能力技能要求等多个因素,做到兼顾不同类型的用户群,也要承担起增强可持续性生态环境的责任,促进社会变革带来积极影响。”


近日,舜禹翻译技术部经理王璐就前段时间引发社会热议的谷歌机器翻译结果异常问题采访了张霄军博士,请他从机器翻译的工程伦理角度评论下此问题。


张博士表示:


该问题主要表现为:当在谷歌翻译源语对话框选择语言为“英语”但输入中文某些中文词汇、且在其目标语对话框选择语言为“中文(简体)”时,输出结果极不合理。不过,谷歌迅速声称问题已经“解决”了,并且言之凿凿“Google翻译是一个自动翻译器,通过数百万已有的翻译模式为用户找到最佳翻译,但是,有些模式会导致翻译的错误。”一时间舆论哗然,谷歌到底是夹带私货“辱华”还是训练语料“背锅”,众说纷纭。但随着问题的快速“解决”,这样的问题再也无法复现,谷歌“翻译风波”似乎就这么不了了之了。



▲截图来自网络


也有网友试图分析了这一现象,提出了“用户反馈”“脏语料”“API调用管理““中介语言”等观点,我认为这些观点基本站不住脚。谷歌翻译的“用户反馈”机制并非完全自动实现,最终反馈采纳与否需要经过后台人工审核。如果是“大量用户”在翻译终端有意为之,在后台也无法通过审核。训练语料的问题也不大可能,用来训练机器翻译系统的语料都是以句子的形式呈现的。经测试,同时出现“艾滋病人”和“武汉人”的汉语句子几乎没有,也没发现同时出现AIDS和Wuhan people的英文句子,训练语料中不可能出现这样的句子。从模型到API调用阶段的管理问题更不可能,谷歌翻译不会为了区区几个词汇去设置不同的调用权限。“中介语言”放大了错误这种说法貌似有理,但也经不住推敲。早期的基于规则的机器翻译系统曾经采用中介语做为翻译中介,但现在的神经网络机器翻译在资源丰富语言的翻译中已经不采用了,倒是在资源贫乏语言的翻译中使用“枢轴翻译(pivot translation)”的方式,分别构建源语到枢轴语的翻译系统和从枢轴语到目标语的翻译系统,然后将两个系统融合。汉语并不是资源贫乏语言,甚至有人还将汉语做为枢轴语言用于其它小语种的互译。这种半监督的模型增强方法是零资源机器翻译的最主要方法,但明显不适用于英汉翻译。
一种叫“词替换(word replacement)”的数据增强方法,有可能会产生上述讹误。词替换是将双语语料中的部分词替换为词表中的其他词。通过替换词,在保证句子语义或者语法正确的前提下,将替换以后的句对添加到训练语料中去,可以增加训练语料的多样性。可以替换源语言中的词,也可以替换目标语言中的词;可以替换常用词,也可以替换稀有词;可以“刻意”替换,也可以随机替换;可以替换掉一个词,也可以丢弃这个词或者用掩码屏蔽该词;可以用词表中的其他词替换,也可以用本句中的其他词替换。词替换方法的本质是对原始双语训练语料进行修改,得到加了噪声以后的伪双语训练语料,以上词替换方式都是对原始语料进行加噪处理。在神经网络机器翻译中,通过加噪进行数据增强的常用方法是:在保证句子整体语义不变的情况下,对原始的双语语料适当加入一些噪声,从而生成伪双语语料来增加原始训练语料的规模。从形式上来看,谷歌翻译极有可能是在加噪进行词替换过程中加入了一些不合时宜的噪声。问题是,这些“不合时宜的词”是怎么产生的?是“刻意”加入的还是随机加入的?
此外,如果给译词出现在源语端给出一个合理的技术解释的话,那可能还使用了另外一种数据增强方法——“回译(back-translation)”。即利用目标语-源语翻译模型(反向翻译模型)生成伪双语句对,用于训练源语-目标语翻译模型(正向翻译模型),通过将目标语言句子复制到源语言端构造出伪训练语料能够提升机器翻译的性能。译词出现在源语端的问题可能在此环节引入。叠加上“词替换”技术引入的错误,系统发布前又不进行严格测试的话,就会出现前文提到的翻译问题。可是,这种“神”操作是谷歌翻译“刻意为之”的还是真如它们所解释的“模式”出错呢?这会涉及到技术的伦理问题。 2018年6月7日,谷歌发布了七条人工智能应用的“伦理原则”,其中第二条就是“避免制造或者强加不公平的偏见(avoid creating or reinforcing unfair bias)”(https://ai.google/principles)。很遗憾,自己制定的原则自己都没有遵守。基于谷歌的七条原则和欧盟发布的《可信赖人工智能的伦理准则》,我提出了可信赖的机器翻译系统的七个原则(拙文全文见《外国语文》2021年第1期),其中提到“用于机器翻译系统训练和测试所用的数据不会被用来伤害或者歧视数据的所有者和用户,同时要确保收集的数据不会用于非法地或不公平地歧视用户的行为”(私密性原则),“在机器翻译系统会对人类的生活造成重大影响时,需要机器翻译系统的决策过程有一个合理的解释”(可解释性原则),“数据集的歧视可能会造成机器翻译系统的针对特定人群或个人的歧视”(公平性原则)。谷歌翻译至少违反了以上三个原则,这不是一句“目前问题已经解决”就能服众的。
数据污染有时候并不仅仅是纯粹技术手段可以解决的,一些场景下需要通过管理工具、甚至是司法工具来解决问题。谷歌翻译的训练数据污染问题是技术问题还是伦理问题还是二者兼而有之,建议可以由“中国人工智能学会AI伦理工作委员会(筹)”牵头组织机器翻译专家和人工智能伦理专家对其进行调查,要求其公开其算法和数据,复现其实验方法(可复现性原则),还天下以大白。

资讯推荐


翻译技术的概念



- END -



转载来源:舜禹环球通Transphere公众号

转载编辑:王琳

审核:陈杲 李丹平


▶ 技术与工具

常见翻译质量保证工具一览

国内外常见语料工具一览

国内外常见术语管理工具

翻译必备术语库和语料库合集(附网址)

翻译必备的计算机翻译辅助软件(附网址)

计算机辅助翻译工具-memoQ 核心功能概览

小牛翻译 Trados 插件新增术语词典功能


▶ 专访

王华树:机器翻译将要取代人工翻译吗?

崔启亮:机器翻译对语言服务企业有多大作用?

韩林涛:文科生如何学习机器翻译?

魏勇鹏:机器翻译质量评估为什么重要?

徐彬:熟练掌握翻译技术,就能做出漂亮的活儿

曹首光:如何打造一款受欢迎的机器翻译产品? 

李梅:机器翻译对未来翻译教育有何影响?

周兴华:高校翻译教师如何学习翻译技术?

丁丽:译后编辑人员与译者身份是否对等?


▶ 实践答疑

一文读懂本地化

如何高效地将机器翻译结果进行译后编辑?

Trados扫盲贴:90%计算机辅助翻译初学者都会陷入的误区

你的多数困惑在《翻译技术100问》中都能找到答案

如何进入全球顶尖翻译大厂:谈谈简历投递雷区


▶ 行业洞察

2021年语言服务行业回顾与展望

2022年翻译行业将迎来哪些新变化

中国电影对外译介的现状与思考

冯志伟:关于机器翻译行业发展的三点建议


▶ 教育创新

王华树 刘世界:人工智能时代翻译技术转向研究

崔启亮:翻译技术教学案例资源建设和应用研究

曹达钦 戴钰涵:人工智能时代高校翻译技术实践环境建设研究

李梅:如何给“技术小白” 开设计算机辅助翻译课程?

张慧玉 崔启亮 徐开:实践导向的MTI人才培养模式——以对外经济贸易大学为例

李长栓:MTI论文千篇一律,如何破局?


继续滑动看下一个
翻译技术教育与研究
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存